草庐IT

c++ - MBCS 到 UTF-8 C++

全部标签

xml - 这是此 xml 文件中的有效 UTF8 字符吗?

我从上游数据源收到了一些XML。我不确定这些奇怪的字符是否是有效的UTF8-或者-上游源代码搞砸了。即错误数据输入=>错误数据输出。我猜下面是传递下来的内容:ValueinXMLfile|UnicodeValue|UTF-8Value|EnglishDescription-------------------------------------------------------------------------------------------’|U+2019|\xe2\x80\x99|RIGHTSINGLEQUOTATIONMARKâ

xml - Perl utf8 binmode 意外结果

为什么binmodeasraw会产生元音变音?能否详细说明“Zurich”字符串在Perl中的内部存储方式?只是有点迷路。usestrict;usewarnings;my$filename="result-test-encoding-raw.xml";open(my$fh,'>',$filename)ordie"die";#binmode$fh,':utf8';#badumlautbinmode$fh,':raw';#goodumlautprint$fh'';print$fh'';my$line_text='Zürich';print$fh$line_text;print$fh'nex

xml - 如何在 Symfony XmlEncoder 中设置编码 UTF-8 和 xmlns 属性

我使用Symfony3Serializer并通过XmlEncoder将我的对象转换为XML。但是XmlEncoder在xml序言中没有编码类型。如何解决这个问题?我可以在根元素后添加带有参数的自定义属性吗?有没有办法在根元素中设置xmlns?我需要这样的XML输出:2010-10-05T16:36:00+04:00...现在我明白了:...我的序列化程序代码片段:$xmlEncoder=newXmlEncoder('realty-feed');$normalizer=newCustomNormalizer();$serializer=newSerializer(array($norma

c - 在 C 语言中,XML 是否适合在 RPG 引擎内部使用?

我是一名C编码新手,想编写一个角色扮演游戏解析库。我的意思是这个程序只会解决那些通过管道输送到它的冲突。例如,当得知Amazing船长在中距离使用他的Blasto眼光束,他的d8射击技能消耗3个能量点,并且他的WildDie对抗在MediumCover后面的CommandantNefarious时,它决定了结果。它本身不会处理任何一个角色,只会处理他们的相关统计数据,攻击者和防御者是谁,以及与它被告知的这个特定Action相关的任何修饰符。问题是它没有内置的规则集。相反,它将从配置文件中获取规则集。这样,相同的核心引擎可用于SavageWorlds虚拟桌面游戏、回合制Rogue-lik

java - 我可以从编码的 UTF-8 字节数组创建 DOM 文档吗?

我的情况:我有一个接受字节数组的方法。有问题的数组使用UTF-8编码,最初是XML消息。我希望能够使用DOM解析器重新构建此消息。我知道我可以通过使用ByteBuffer从字节数组创建文档。唯一的问题是,如果我将其直接应用于传递的字节数组,它将创建一个损坏的文档(如果可能的话)。这是因为数组是一个编码的XML消息,以UTF-8编码。但是,当我使用decode()方法解码数组时,我得到返回的CharBuffer:ByteBufferencodedData=ByteBuffer.wrap(data);CharBufferdecodedData=Charset.forName("UTF-8"

java - 如何让 XSLT 在 Java 中返回 UTF-8

我正在尝试让我的XSL脚本使用UTF-8编码。像åäö和希腊字符这样的字符就像垃圾一样出现。让它工作的唯一方法是将结果写入文件。如果我将它写入输出流,它只会返回垃圾(System.out有效,但这可能是因为它被重定向到一个文件)。结果需要从servlet返回,请注意这不是servlet配置问题。我可以从servlet返回一个带有希腊字符的硬编码字符串,它工作正常,所以这是一个转换问题。这是我当前的(简化的)代码。protectedvoiddoGet(finalHttpServletRequestrequest,finalHttpServletResponseresponse)throw

c++ - 在没有库的情况下用 C 解析 XML。

按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。谁能给我一个关于仅使用标准库在独立C中解析xml的过程的概述。我想把它作为练习,因为这实际上是一个有用的项目。我看到的大多数示例似乎都大量使用了指针以及结构数组。因此,我们将不胜感激任何提示或大纲。

java - 将 Windows-1252 xml 文件转换为 UTF-8

是否有任何方法可以将大型XML文件(500+MB)从“Windows-1252”编码转换为java中的“UTF-8”编码? 最佳答案 当然:打开一个包裹在InputStreamReader中的FileInputStream,输入为Windows-1252打开一个包裹在OutputStreamWriter中的FileOutputStream,输出采用UTF-8编码创建一个缓冲区字符数组(例如16K)重复读入数组并写入已写入的内容:char[]buffer=newchar[16*1024];intcharsRead;while((cha

xml - XML 文件中的 UTF-8 与 UTF8

XML文件中正确的UTF8编码声明是什么?我都见过。...或... 最佳答案 XML规范(https://www.w3.org/TR/REC-xml/#charencoding)说:Inanencodingdeclaration,thevalues"UTF-8","UTF-16","ISO-10646-UCS-2",and"ISO-10646-UCS-4"shouldbeusedforthevariousencodingsandtransformationsofUnicode/ISO/IEC10646...此外,“encoding”

.net - 你是如何让 ASP.NET 输出 UTF-16 编码文本的?

您是如何让ASP.NET输出UTF-16编码文本的?我在.NET中序列化了一个默认为UTF-16格式的对象。现在我想将字符串作为对.ashx请求的输出响应发送。我得到错误:不支持从当前编码切换到指定编码。错误处理资源如何让我的网站或页面使用UTF-16格式。谢谢。更新:阅读两个答案。 最佳答案 一般来说:不要。作为UTF-16的网页混淆了许多工具,并使浏览器以奇怪的、意想不到的方式运行。(例如:链接脚本、表单提交、代理)。UTF-16只能作为二进制对象安全提供,因此对于Web内容,请坚持使用ASCII超集的编码-显而易见的选择是UT